Logiciel d'aide à l'étiquetage morpho-syntaxique de textes de spécialité
نویسندگان
چکیده
Résumé. La compréhension de textes de spécialité nécessite un étiquetage morpho-syntaxique de bonne qualité. Or, lorsque les textes étudiés sont issus de domaines spécifiques et peu usités, il est rare de disposer de dictionnaires et autres ressources lexicales fiables. Le logiciel que nous proposons permet d’utiliser un étiquetage réalisé par un étiqueteur généraliste, puis d’améliorer cet étiquetage en intégrant des connaissances d’experts du domaine étudié. Grâce au logiciel développé, il est relativement aisé pour un expert du domaine de détecter des erreurs d’étiquetage et de mettre en place des règles de ré-étiquetage. Ces règles peuvent être obtenues de deux manières différentes : (1) soit en utilisant un langage de programmation permettant d’exprimer des règles complexes de ré-étiquetage, (2) soit par apprentissage automatique des règles à partir d’exemples corrigés au moyen d’une interface dédiée. Cet apprentissage propose de nouvelles règles à l’expert, acquises automatiquement.
منابع مشابه
Extraction de termes centrée autour de l'expert
Résumé. Nous développons un logiciel, Exit, capable d’aider un expert à extraire des termes qu’il trouve pertinents dans des textes de spécialité. Tout est mis en place pour faciliter le travail de l’expert afin qu’il puisse consacrer son temps à la seule reconnaissance des termes pertinents. Pour cela, différentes mesures statistiques et de nombreuses options d’extraction sont disponibles dans...
متن کاملL'alignement des documents médiévaux
RÉSUMÉ. Le but de l’alignement des textes est la mise en correspondance des sous-parties similaires de deux ou plusieurs traductions ou versions d’un même écrit. La plupart des méthodes utilisées dans la technique d’alignement reposent sur l’analyse statistique des fréquences de mots ou de caractères, ou sur la cooccurrence des chaînes que ceux-ci constituent. Afin d’en améliorer l’efficacité, ...
متن کاملPronoun Anaphora Resolution for Automatic Correction of Grammatical Errors (Correction automatique par résolution d'anaphores pronominales) [in French]
Résumé. Cet article décrit des travaux réalisés dans le cadre du développement du correcteur automatique d’un logiciel commercial d’aide à la rédaction du français. Nous voulons corriger des erreurs uniquement détectables lorsque l’antécédent de certains pronoms est connu. Nous décrivons un algorithme de résolution des anaphores pronominales intraet interphrastiques s’appuyant peu sur la corres...
متن کاملStratégies pour l'étiquetage et l'analyse syntaxique statistique de phénomènes difficiles en français : études de cas avec Talismane
RÉSUMÉ. Les outils statistiques robustes en TAL, tels que les étiqueteurs morphosyntaxiques et les analyseurs syntaxiques, utilisent souvent des descripteurs « pauvres », qui peuvent être appliqués facilement à n’importe quelle langue, mais ne prennent pas en compte les particularités de la langue. Dans cette étude, nous cherchons à améliorer l’analyse de deux phénomènes en français en injectan...
متن کاملLes termes complexes dans les LSP: des processus de collaboration entre les unités textuelles et les unités terminologiques
Résumé : Notre projet concerne l’étude du comportement et de la linéarité des termes complexes (TC) en perspective contrastive français/italien, à l’intérieur des textes de spécialité. Notamment, notre objectif est de présenter comment les TC peuvent se modifier à l’intérieur des textes de spécialité et quels sont les raisons qui poussent à leur variation. Notre poster s'insère dans le cadre d'...
متن کامل